五分钟讲解什么是lora 笔记
gpt 主模型会输出语言,但这时候我想要训练他讲火星文,原模型的 w 参数矩阵是很大的,所以这时候我要想办法更新的时候不用这么大矩阵都更新。那就想局部矩阵用来更新就好,我们把原参数固定 w0,现在训练的参数 w=w0+ w1。
gpt 主模型会输出语言,但这时候我想要训练他讲火星文,原模型的 w 参数矩阵是很大的,所以这时候我要想办法更新的时候不用这么大矩阵都更新。那就想局部矩阵用来更新就好,我们把原参数固定 w0,现在训练的参数 w=w0+ w1。
AI创业,这几年是一场轰轰烈烈的热潮。2023年“百模大战”,2024年资本狂飙,2025年却开始逐渐冷静下来。很多人以为,搞个“GPT+”产品就能拿融资、撬市场、改命运。可现实很快打脸:大模型不是万能钥匙,创业也不是堆个demo就完事。
9月22日晚,DeepSeek的官方API平台突然跳出一条更新通知——“DeepSeek-V3.1-Terminus已上线,同步开源”。短短半小时,Hugging Face和ModelScope的开源地址被开发者挤到卡顿,知乎“DeepSeek终极版”话题直接
在语音 AI 领域,模型想要做到「反应快」「会思考」「表达好」,几乎就是不可能三角:要么逻辑缜密但反应慢,要么响应迅速但没啥逻辑深度。Mini-Omni-Reasoner 的出现,打破了这个困境。它不是单纯加快语速,也不是堆大模型,而是提出了一个全新的思路——
本来大家都以为他忙着把OpenAI打造成算力帝国,天天跟模型、芯片打交道,结果他突然扔出个大消息,旗下公司RetroBiosciences要搞“年轻大脑药丸”,年底前就在澳大利亚让第一个人试吃,这药名叫RTR242。
AI创业看似风口,实则暗藏陷阱。本文回顾2025年多个真实案例,拆解创业者在技术选型、产品定位、商业化路径上的典型误区,是一份面向AI创业者的避坑指南,也是理解AI产品从0到1的冷静思考。
市值超4000亿元的“果链”龙头立讯精密直接封死涨停,歌尔股份、蓝思科技等产业链个股紧随其后,单日涨幅均突破5%.
从指数表现来看,本周(2025-09-15至2025-09-19),上证指数周涨跌幅为-1.3%,创业板指周涨跌幅为2.34%,沪深300周涨跌幅为-0.44%,中证1000周涨跌幅为0.21%,恒生科技周涨跌幅为5.09%,纳斯达克指数周涨跌幅为2.21%;
现在的人用AI早已经不是指令+执行”这一套老规矩了,在之前人们都希望AI听话懂事,现在竟然反了过来,喜欢上了那些有脾气、会“叛逆”的家伙。
9月19日,一场以“趣!生长”为主题的有意思生活方式大会在北京举行。深圳龙岗凭借“趣龙岗 有意思”城区IP,获评“2025有意思品牌”案例。与众多商业品牌并列,以行政区身份脱颖而出,龙岗的入选无疑令人眼前一亮——它确实“有点意思”。
在当今科技飞速发展的时代,人工智能(AI)无疑是最耀眼的领域之一。各大科技巨头在AI赛道上你追我赶,不断推出令人瞩目的成果,也引发了一系列激烈的争论。其中,关于AI是否已达到“博士水平”智能的讨论,成为了科技界和大众关注的焦点。谷歌DeepMind首席执行官、
数学圈出了件新鲜事:GPT-5居然以作者身份登上了数学论文!这可不是随便凑数,它真的帮着推导了 “第四矩定理” 的收敛速度。
多账号发布最头疼的就是漏平台,明明准备了内容,一不小心就忘了同步某个号,流量白白浪费,咱们来看看真实数据,自媒体人平均运营 6.8 个平台,但近 70% 的人承认曾因手动发布漏掉至少 1 个平台,别急,下面用具体方案帮你解决。
Python凭借它“人生苦短,我用Python”的潇洒,还有背后庞大的生态库,稳坐AI界的头把交椅,从入门小哥到学术大牛,人人都爱它。而Rust以其“内存安全、零成本抽象、无畏并发”三件法宝,正在受到大公司和开发者们的青睐。
9月初,估值超过1800亿美金的AI大厂Anthropic,宣布禁止中国公司控制的实体、在海外的分支机构等使用其主要产品Claude系列提供的AI服务。
由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期刊《自然(Nature)》的封面。与今年1月发布的DeepSeek-R1的初版论文相比,本次论文披露了更多模型训练的细节,并正面回应了模型发布之初的蒸馏
我做AI产品经理这几年,天天跟工程师聊模型优化,其实Transformer没那么复杂,今天就用几个小故事,把它讲清楚。
模型 gpt transformer rnn 座位号 2025-09-16 00:29 10
家人们,今天咱唠唠 Transformer,这可是 AI 界的超级大明星,现在大火的 GPT、文心一言这些大模型,背后都离不开它撑腰。别一听技术就头疼,咱用大白话唠,保证你轻松 get!
模型 gpt 文心 拆解 transformer 2025-09-15 19:57 8
从2022年10月“GPT时刻”开始,人工智能领域的迭代速度便如脱缰野马。身处其中的开发者,无不感受到一种强烈的“AI一天,人间一年”的集体焦虑。
深信服以绝对领先的实战能力,在“基于智能体的网络安全自动化分析响应”“网络安全告警日志降噪”及“大模型生成内容安全风险检测”三大硬核场景中全部斩获第一名的成绩,成为本次测试中唯一包揽三项第一的安全厂商!